- Дипломы
- Курсовые
- Рефераты
- Отчеты по практике
- Диссертации
Постановка цели исследования и представление данных
Дискриминантный анализ — анализ различий заранее заданных групп объектов исследования (потребителей, товаров, брендов и т.п.). Переменная, разделяющая совокупность объектов исследования на группы, называется группирующей. С помощью дискриминантного анализа изучаются различия между двумя или более группами по определенным признакам. Признаки, используемые для выявления различий между группами, называются дискриминационными переменными. С точки зрения теории статистики группирующая переменная должна быть номинальной, т.е. измеряться по номинальной шкале, а зависимые переменные — метрическими (см. подраздел 2.3 «Типы шкал измерения переменных»). Соблюдение этого условия обеспечивает высокую точность статистических расчетов. Однако на практике при использовании SPSS допускается, что группирующая переменная может быть номинааьной или порядковой, а дискриминационные переменные могут измеряться по шкале любого типа. Результатом дискриминантного анализа является построение дискриминантной модели (дискриминантной функции), которая имеег вид где d — группирующая (зависимая) переменная; bп — коэффициенты дискриминантной функции; а — свободный член (константа); хп — дискриминационные (независимые) переменные. С помощью этой модели, зная харакгеристики объекта исследования, можно с определенной степенью уверенности определить его принадлежность к одной из исследованных групп. Например, требуется построить дискриминантную модель, при помощи которой на основании социально-демографических признаков (пол, возраст, образование, доход семьи) можно было бы причислить туриста к одной из двух групп: посещающих и не посещающих дискотеки (рис. 7.1). Для того чтобы построить дискриминантную модель, следует сначала выяснить, все ли выбранные дискриминационные переменные в действительности служат отличительными признаками исследуемых групп (п = 4?). Только после этого можно построить дискриминантную модель (я, Ьп). В нашем примере для дискриминантного анализа используются данные, собранные в результате опроса туристов, отдыхающих в курортной зоне «Баварский лес». Информация по группирующей переменной формируется из ответов респондентов на вопрос анкеты № 4: «Какие заведения/ мероприятия Вы часто посещаете во время отдыха?» В качестве ответа на этот вопрос респондентам предлагается выбрать один или несколько вариантов из 11 предложенных ответов. В качестве ответа № 7 предлагается вариант «дискотеки». При занесении в файл данных SPSS ответов на многовариантные вопросы создается несколько дихотомических переменных (см. раздел 2.2 «Виды кодировки данных»). В рассматриваемом примере вопрос анкеты № 44 представлен в файле данных SPSS в виде семи переменных (рис. 7.2). В рассматриваемом примере дискриминантного анализа в качестве группирующей переменной используется переменная с именем «q_44_7» и меткой «Посещение дискотек». Метка этой переменной имеет два значения: «1» — «да» и «2» — «нет», которые разделяют опрашиваемых туристов на две группы: посещающие и не посещающие дискотеки. Ответы респондентов, которые затруднились или не захотели отвечать на этот вопрос («98», «99»), не участвуют в исследовании, о чем есть пометка в столбце «Missing». В качестве дискриминационных переменных в рассматриваемом примере используются социально-демографические признаки туристов: пол, возраст, образование и доход семьи (рис. 7.3). Переменная с именем «s_J» и меткой «Пол» имеет всего два значения («1» — «мужчины», «2» — женщины), т.е. она является дихотомической. Переменная с именем «s_2a» и меткой «Возраст» является метрической переменной. Ответы на соответствующий вопрос анкеты выражаются в числах, поэтому числовые коды значений метки переменной отсутствуют, о чем говорит отметка «None» в столбце «Values». Переменная с именем «s_4» и меткой «Образование» является порядковой переменной. Значения меток этой переменной относятся к 7 категориям, соответствующим уровням иерархии системы образования в Германии. Переменная с именем «s_9» и меткой «Доход семьи» также является порядковой. Значения этой переменной представлены 9 категориями туристов по уровню дохода семьи: «1» — «до 500 евро», «2» — «от 500 до 900 евро», «3» — «от 900 до 1250 евро», «4» — «от 1250 до 1800 евро» ... «9» — «свыше 3800 евро» в неделю. Как отмечалось выше, не все из выбранных дискриминационных переменных в действительности могут выступать в качестве отличительных признаков исследуемых групп. Если они таковыми не являются, они должны быть исключены из дискриминантной модели. В целом при выполнении дискриминантного анализа решаются следующие задачи: Оценивается выбор дискриминационных переменных. Строится дискриминантная модель. Оценивается точность прогнозов на основе построенной дискриминантной модели.
Каталог работ |